<div class='content'>

	<h2>项目描述</h2>
	
	<p><b class=red>什么能发高分？</b>: discovery 新机理 / 
resource 测了新的基因组 / 
method 发明了新的方法 / 
tools 网站、软件</p>
	<pre class=saying>学习一项技能最好的办法就是使用它，而且要一直不停的使用它。</pre>

	<p>项目1：二代测序的实验部分：建库、上机测序。建库(打断、加接头和index)、质控、测序仪上机。</p>
	<p>项目2：数据处理和分析，主要是<b class=red>下机质控、数据清洗、统计与画图、生成报告</b>。熟悉常见的分析流程: SNP/InDel/ChipSeq/ATAC-seq/RNA-seq/scRNA-seq/Methlation-seq</p>
	<p>项目3：自动化-脚本化：把分析过程写成可配置的傻瓜化分析流程(Rscript、snakemake等)，降低人力成本；多线程：适应并行执行，节省时间。
		<b>脚本化做到极致</b>，遵守软件工程的原则，函数化、模块化、高内聚低耦合，参数都配置到config文件(夹)中。</p>
	<p>项目4：网页化: 稳定的版本做成Web App(R shiny/plumber、Python Flask等)，傻瓜化运行，最大程度降低使用门槛，方便推广出圈。</p>
	<p>项目5：镜像化: 使用 docker 或 k8s 技术，把流程镜像化，方便推广和适应各种硬件环境。</p>
	

	<p>项目n：
		<b>先标准化、流程化，再自动化。</b>
		自制生信视频教程 
		<a target="_blank" href="https://study.163.com/provider/400000000359002/index.htm">网易云课堂</a>，
		<a target="_blank" href="https://space.bilibili.com/169588349">bilibili</a>，
	</p>
	<p>流程化不难，不过科研就是讲究反流程化。如果数据不多，没必要死磕流程化，没技术含量，只是很绚很好玩而已，修补bug测试又很花时间。但是记住：<b>找到自己的定位，明确自己的科学问题，协助发现有意义的生物学规律，发paper，申请funding，冲刺顶刊，不要玩物丧志。</b></p>
	
	<p>期望：使用数据挖掘与机器学习挖掘生物学数据，研究与开发基于web的NGS高通量数据分析方法和工具，找出决定表型的分子差异，使肿瘤与免疫基因组数据分析与解读更便捷、更高效。</p>

	<pre class=saying>一个人必须不停地写作，才能不被茫茫人海湮灭。</pre>






	<h3>Illumina 测序原理</h3>
    <p>
        <a href="https://support-docs.illumina.com/SHARE/IndexedSeq/Content/SHARE/IndexedSequencing/DualIndexSeq.htm">Dual-Indexed Sequencing Overview</a>:
        双端测序顺序: Read1, index1, index2, Read2; 有两种测序方法(Forward Strand, Reverse Complement)，区别是 Index2 是否反向互补。
    </p>









	<h3>NGS分析教程</h3>
	<pre class=saying>生信/CS是工具，在生命科学的土壤上，开荒拓界的工具。</pre>
<pre>
涉及到蛋白质与DNA互作研究可使用 ChIP-seq、CUT&Tag

涉及到蛋白质与RNA互作研究(如m6A) RIP-seq、CLIP-seq等。
</pre>
	<p>
		<b>生信算法</b>: 
		<a target="_blank" href="http://rosalind.info/problems/locations/">rosalind</a>，
		<a target="_blank" href="https://www.cnblogs.com/leezx/" class="button pink">Digital-LI 日常文献</a>，
	</p>
	
	<p>
		<b>纽约大学 生信电子书</b>: 
		<a target="_blank" class="button pink" href="https://learn.gencore.bio.nyu.edu/">NYU:mastering NGS analysis</a>:(
		<a target="_blank" href="https://learn.gencore.bio.nyu.edu/single-cell-rnaseq/seurat-part-4-cell-clustering/">Seurat part 4 – Cell clustering</a> |
		<a target="_blank" href="https://learn.gencore.bio.nyu.edu/variant-calling/">Variant Calling</a> |
		<a target="_blank" href="https://learn.gencore.bio.nyu.edu/seurat-integration-and-label-transfer/">Seurat: Integration and Label Transfer</a> |
		)
		
		
		<a target="_blank" class="button pink" href="https://wikis.utexas.edu/display/bioiteam/IGV+Tutorial+--+GVA2019">德克萨斯大学 IGV 教程</a> |
	</p>
	
	
	<p>
		<b>待归类优质教程</b>:
		<a target="_blank" href="https://space.bilibili.com/133143880">各种组学视频</a> | 
		<a target="_blank" href="http://genomicsclass.github.io/book/" class="button blue">PH525x series</a> - Biomedical Data Science | 
	</p>
	
	
	<p>
		<b>GEO 分析专题</b>: 
		<a target="_blank" href="https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzIyMzA2MTcwMg==&action=getalbum&album_id=1336387615767199745">果子的GEO教程</a>  | 
	</p>	
	
	<p>
		<b>TCGA分析工具</b>: 
		<a target="_blank" href="http://gepia2.cancer-pku.cn/#analysis">gepia2</a>  | 
	</p>
	
	<p>
		<b>单细胞分析</b>:
		<a target="_blank" href="http://blog.genesino.com/">Chen Tong</a>(生信文章集锦/Linux/单细胞/)  | 
		<a target="_blank" class='button orange' href='http://www.cnblogs.com/emanlee/category/302300.html' title='cnblog博客'>emanlee博客</a>
	</p>

	<p>
		<b>Github</b>:
		<a target="_blank" href="https://github.com/griffithlab/rnaseq_tutorial/wiki">griffithLab</a>(rnaseq_tutorial)  | 
		<a target="_blank" href="https://github.com/hallamlab/mp_tutorial/wiki/Introduction-to-Downstream-Analysis-in-R">下游分析</a>(R/ggplot2)  | 
		<a class="button blue" target="_blank" href="https://github.com/openbiox/bioinformatics-100-days">bioinformatics-100-days</a>(R/)  | 
		<a target="_blank" href="https://github.com/DawnEve/ImmunogenomicLandscape-BloodCancers/">免疫画图</a>(R/ggplot2)  | 
	</p>

	<p>
		<b>流程化</b>:
		<a target="_blank" href="https://zhenglei.blog.csdn.net/">白墨石</a>(生信/Nextflow/Vue/DB/)  | 
		<a target="_blank" href='http://www.bioconductor.org/help/docker/'>docker for bioconductor</a> |
	</p>
	
	<p> 
		<b>知名博主</b>:
		<a target="_blank" href="https://blog.csdn.net/herokoking">高锦</a>(生信/linux/python/perl/和甲基化/<a target="_blank" href="https://blog.csdn.net/herokoking/article/details/78292616">下载GTF文件</a>)  | 
		<a target="_blank" href="http://blog.sina.com.cn/s/articlelist_1964759364_2_1.html">Mars-Zhan</a>(生信/java/linux/)  | 
		<a target="_blank" href="http://blog.sina.com.cn/s/blog_70b2b60201016qkt.html">akka9981</a>(生信/perl/shell/R/seqLogo/)  | 
		<a target="_blank" class='orange' href='http://blog.sina.com.cn/s/articlelist_1728333092_0_1.html' title='R软件包'>铁汉1990@sina</a>(生信/统计/Perl/) |

		<br>
		<a target="_blank" href="https://mmg434.readthedocs.io/en/latest/dayfivemod.html">RNAseq生信入门</a>(basic Linux/edgeR)  | 
		<a target="_blank" href="https://bioconductor.github.io/BiocWorkshops/rna-seq-analysis-is-easy-as-1-2-3-with-limma-glimma-and-edger.html">bioconductor的专题</a>(R/bioconductor)  | 
	</p>
	






	
	
	
	<h2>测序分析相关</h2>
<!--pre>
参考基因组下载：
https://cloud.google.com/genomics/docs/public-datasets/ucsc
</pre-->
	<hr>新闻资讯: 
	<a target="_blank" class='red' href='http://seqanswers.com/'>seqanswers论坛</a> | 
	<a target="_blank" class='red' href='http://www.rna-seqblog.com/'>rna-seqblog</a> | 
	<a target="_blank" class='red' href='https://www.biostars.org/' title='生物测序问答网站'>biostars</a> | 
	<a target="_blank" class='red' href='https://www.genomeweb.com/' title="jimmymall at live.com">genomeweb新闻</a> | 

	<a target="_blank" href='http://www.genotypic.co.in/' title='印度公司'>印度测序公司</a> |
	<a target="_blank" href='http://www.epibiotek.com/' title='测序公司'>广州表观生物</a> |

	
	<hr>相关软件: 
	<a target="_blank" class='red' href='http://software.broadinstitute.org/software/igv/'>IGV可视化</a> | 
	<a target="_blank" class='red' href='http://circos.ca/documentation/tutorials/quick_start/'>circos快速入门</a> | 
	<a target="_blank" class='red' href='http://www.bioinformatics.babraham.ac.uk/projects/download.html#fastqc'>fastQC</a> | 
	<a target="_blank" class='orange' href='http://bioconductor.org/packages/cummeRbund/' title='R软件包'>cummeRbund</a> | 
	<a target="_blank" class='orange' href='https://labs.genetics.ucla.edu/horvath/htdocs/CoexpressionNetwork/Rpackages/WGCNA/' title='wgcna加权基因共表达网络'>wgcna</a> | 


	<hr>编程与源码: 
	<a target="_blank" class='button blue' href='https://github.com/trinityrnaseq/trinityrnaseq/tree/master/util/misc' title='trinity源码'>Perl代码</a>
	<a target="_blank" class='button blue' href='https://github.com/DawnEve/ImmunogenomicLandscape-BloodCancers' title='R代码'>R代码</a>

	
	
	
	
		
	<h2>测序数据分析软件和工作流</h2>
	<p>常用的工作流语言包括 snakemake, cwl/wdl, nextflow 等。及配套的环境构建工具 conda, docker, singularity 等。</p>
	<br>
	
	<img src='data/NGS/images/bioinfoSoft.png'>
	
	<h3>workFlow</h3>
	<img src='data/NGS/images/workFlow.png'>
	
	
	<h3>测序数据分析服务公司</h3>
	<p> <a href='http://www.smartquerier.com/' target="_blank">上海慧算生物技术有限公司</a>探索生命奥秘，促进人类健康，为生物医学领域的科研和临床应用提供专业、可信的精准医疗产品以及生物医学大数据分析、生物医学云计算和专家咨询服务，并为生物医学领域培养和输送专业的生物信息学人才。</p>
	
	<p> <a href='http://www.shouzhiquan.com/' target="_blank">重庆寿之泉生物</a>生物信息  转录组 宏基因组 RNA-Seq 芯片数据分析 变异检测 SNP分析 比较基因组。</p>
	
	<p>上海尔云 <a href='http://www.iyunbio.com/' target="_blank">测序数据分析</a> </p>


	
	
	
<h2>生物信息学的核心课程</h2>	
<pre>
名校超牛逼课程生信课程(数学+计算机+生物): https://github.com/ossu/bioinformatics


生物信息学的核心课程
http://www.cnblogs.com/emanlee/archive/2011/05/29/2062253.html
1、数学：高数（上册，下册）、线代、概率论、随机过程，离散数学；
2、生物：普通生物学、生物化学、分子生物学、细胞生物学、遗传学、基因组学、蛋白组学等；
3、计算机：计算机基础、Linux、R语言、C语言/C++/JAVA/Python/Perl、数据结构、数据库、数据挖掘、计算机算法、软件工程。
这是最基本的，根据方向还有其他很多要学习的。



另外，学习生物信息，paper是肯定要跟踪。这两个网站大家可以经常看一下：
1、https://www.homolog.us/blogs/
它覆盖生物信息有趣的论文， 算法，以及生物科学问题。这个网站还汇集了很多生物信息领域科学家的博客。

2、http://www.rna-seqblog.com/
这个网站会推荐新的论文、工作、培训课程、大型会议等。



1.先学习流程
必定会遇到的三个问题
	1)在linux上安装和使用软件(Linux模块)
	2)需要对数据进行筛选(程序模块)
	3)写文章要画图(R语言模块)

学习生信，常走的弯路：
	1.门类太广无从下手
	2.书本太理论，看完忘光
	3.不会linux命令
	4.不会编程

课程设计：
	1.生信常用linux命令
	2.编程语言 Python3/perl
	3.画图语言R
	4.可视化工具IGV
	4.项目实战

生物信息学小门类：
	转录组
	变异检测
	芯片数据分析
	宏基因组
	比较基因组
	蛋白质结构预测
	分子模拟
	三维基因组

已经入门，想提高，只能不停地实践！
入门的好方法：找一篇高分论文，照着里面的做，原封不动的还原出来，理解参数设置的意义。过程中啥不会补啥。

本文首次添加：13:27 2016/5/3
update：16:37 2020/8/14
</pre>





	
	
	
	<h2>试剂公司</h2>
	<p>QIAGEN <a href='https://www.qiagen.com/cn/resources/molecular-biology-methods/ngs/' target="_blank">二代测序(NGS)实验方案和应用</a>, 这里为您介绍二代测序的相关流程和应用。</p>

	
</div>
